Descritption de notre sujet

Notre projet porte sur la représentation des Airbnb au sein de grandes villes européennes, plus particulièrement sur le prix de location des biens imobiliers renseignés sur l’application.
Notre travail comporte deux parties. Dans la première, nous tenterons d’expliquer les différences de prix entre les logements et, dans la deuxième, nous nous intéresserons à la représentation graphique de la répartition des biens.

Nos données proviennent du site kaggle : https://www.kaggle.com/datasets/thedevastator/airbnb-prices-in-european-cities

Nous disposons du prix des locations la semaine et le week-end pour 10 villes européennes.

Quels sont les facteurs qui permettent d’expliquer la différence de prix entre deux biens?

Premières analyses

Prix moyens des Airbnb selon la période
prix_moyen période
270.86 Semaine
276.33 Weekend

Il est clair que les Airbnb sont plus chers le week-end. On cherche alors à quantifier l’influence de plusieurs variables explicatives sur le prix des Airbnb. Plus précisément, nous cherchons les variables qui permettent d’expliquer les différences de prix entre la semaine et le week-end.
Nous avons fait le choix de limiter la taille de l’échantillon car, dans la base de données, il y a une trentaine de logements dont le coût de location dépasse les 8 000€, ce qui compromet la comparaison.

Nous allons à présent modéliser le prix des logements en fonction des variables suivantes:

  • room_type : facteur à 3 modalités (appartement privé, chambre partagé, chambre privée)
  • person_capacity : nombre de personnes pouvant loger dans l’appartement
  • host_is_superhost : variable binaire (vaut 1 si le propriétaire à été reconnu comme quelqu’un de confiance par les utilisateurs)
  • cleanliness_rating : note de propreté sur 10
  • guest_satsifaction_overall : note de satsifaction des utilisateurs sur 100
  • bedrooms : nombre de chambres
  • metro_dist : distance au métro
  • dist : distance au centre de la ville

Les maisons et les appartements privés sont logiquement plus chers que les chambres privées et les chambres partagées. En général, plus un bien est cher en semaine, plus il sera cher le week-end.
On observe que plusieurs logements ne proposent pas de location le week-end.

Analyse des corrélations

D’après les matrices de corrélation, il n’y a pas de différence significative entre les corrélations des variables la semaine et le week-end.

Régressions linéaires

Résumé de la régression linéaire pour la semaine
Estimate Std. Error t value Pr(>|t|)
(Intercept) 208.0888913 24.9287917 8.347332 0.0000000
room_typePrivate room -100.1301521 5.1665056 -19.380633 0.0000000
room_typeShared room -176.1526713 24.9145960 -7.070260 0.0000000
person_capacity 3.7584001 2.3031164 1.631876 0.1027176
host_is_superhostTrue -36.9849807 5.0332327 -7.348156 0.0000000
cleanliness_rating -4.4837857 3.1759480 -1.411794 0.1580223
bedrooms 85.9268580 4.2098371 20.410970 0.0000000
guest_satisfaction_overall 0.5108604 0.3369012 1.516351 0.1294426
metro_dist -31.9233201 3.0961241 -10.310737 0.0000000
dist 6.2195975 1.0834416 5.740593 0.0000000
Résumé de la régression linéaire pour le week-end
Estimate Std. Error t value Pr(>|t|)
(Intercept) 237.0565123 20.5103482 11.5578980 0.0000000
room_typePrivate room -90.7245344 4.2507808 -21.3430281 0.0000000
room_typeShared room -165.4936406 20.4986686 -8.0733849 0.0000000
person_capacity 3.2180134 1.8949061 1.6982443 0.0894735
host_is_superhostTrue -41.2353827 4.1411295 -9.9575206 0.0000000
cleanliness_rating 1.9060316 2.6130348 0.7294322 0.4657438
guest_satisfaction_overall -0.2504983 0.2771879 -0.9037127 0.3661561
bedrooms 74.3852759 3.4636747 21.4758264 0.0000000
metro_dist -32.1767754 2.5473590 -12.6314254 0.0000000
dist 5.9211076 0.8914096 6.6424095 0.0000000

Le type de chambre, la confiance qu’ont les utilisateurs envers le propriétaire, le nombre de chambres, la distance au métro et la distance au centre ville expliquent de manière significative, au niveau 0.1%, le prix du logements la semaine. On fait le même constat pour le week-end et on observe également que le nombre de personnes pouvant loger dans l’appartement est une variable significative au niveau 10%. On peut penser que les familles et les groupes d’amis ont plutôt tendance à réserver des logements le week-end.

Zoom sur le type de logement et la confiance envers le propriétaire

On souhaite déterminer si le prix moyen des logements diffère selon les différentes modalités des variables room_type et host_is_superhost.

On observe une légère différence de prix pour les maisons et les appartements privés selon que le propriétaire ait été reconnu comme quelqu’un de confiance par les utilisateurs ou pas. Quelque soit la période, ces biens ont tendance a être moins chers lorsque le propriétaire a été reconnu comme une personne de confiance.

Conclusion

Aucune caractéristique ne semble plus importante que les autres quand il s’agit d’expliquer la différence de prix des Airbnb entre la semaine et le weekend.
On peut néanmoins noter que le week-end est généralement un moment où les utilisateurs ont plus de temps libre et peuvent voyager, ce qui entraîne une augmentation de la demande des Airbnb et donc une augmentation des prix.
De plus, les hôtes Airbnb peuvent réduire leur disponibilité le week-end pour des raisons personnelles, ce qui peut réduire l’offre de locations disponibles et augmenter les prix en raison de la concurrence accrue pour les locations restantes.
Enfin, les voyageurs ont souvent tendance à réserver des séjour plus longs le week-end, ce qui peut augmenter le prix moyen de la nuitée en raison de la réuction de la disponibilité des logements à court terme.

Application R Shiny

Pour illustrer nos données, nous avons réalisé une application sur R Shiny présentant sur une première page une carte intéractive réalisée avec le package leaflet.
Nous avons fait un zoom sur l’Europe occidentale et nous avons représenté les clusters des locations disponibles sur Airbnb dans les 10 villes de notre base de données.
Les pays sont colorés en fonction du prix moyen des locations et chaque bien est coloré en fonction de son prix.
Nous avons ajouté un filtre permettant de zoomer sur la ville du pays sélectionné, un bouton pour choisir la période, ainsi qu’une barre de pricing permettant de sélectionner une fourchette de prix.
Nous avons également ajouté un histogramme représentant la répartition des Airbnb en fonction du prix. L’histogramme s’adapte à la sélection.
Sur une deuxième page, nous avons fait figurer un ensemble de graphes présentant des statistiques descriptives diverses et variées sur les variables.

Lien vers l’application: https://jacderennes2.shinyapps.io/r_bnb/